15-7. 生命科学におけるビッグデータの出現
https://gyazo.com/c46126ed3d416a19ff66aa9dd02da825
https://amzn.to/2I6DMZu
1) シングルオミクスからトランスオミクスへ
DNA
ゲノム
ゲノミクス
エピゲノミクス
RNA
トランスクリプトーム
トランスクリプトミクス
タンパク質
プロテオーム
プロテオミクス
代謝物
メタボローム
メタボロミクス
現在の解析
DNAやRNAは次世代シークエンサー
タンパク質や代謝物は高感度質量分析計
ビッグデータ
各オミクスには多くのバリエーションがある(e.g. 細胞種別、個人別、疾患別、人種別、年齢別など)→膨大
トランスオミクス
全体像把握のために各オミクス(シングルオミクス)の相互作用を明らかにする
https://gyazo.com/91104d2c3a55d38e70f2c2f2708b5c40
ただ限定的なトランスオミクス(e.g. 肥満などの特定疾患)でさえその全貌を掴みきれていない
トランスオミクスに特化したバイオインフォマティクス(生命情報学)や統計学を駆使した収集データの正確な評価/意義づけが求められている
2) 生命情報とゲノム医療
GWAS(ゲノムワイド関連解析)
疾患の有無や種々の生物学的形質に関連するゲノム多型マーカーを網羅的にスクリーニングする手法
これまではSNPアレイを用いた手法が中心だったが、現在ではNGSによる全ゲノムシークエンシングが行われている
さらにパーソナルシークエンシングデータによる精密医療(precision medicine)という方向性も進んでいる
各個人のゲノム情報や生活習慣に基づく治療と予防
医療においてもシングルオミクスデータがビッグデータとして蓄積しており、その個々の解析やリンク(トランスオミクス解析)が今後の医療にどう利用されるかが課題
3) 生命科学研究のパラダイムシフト
発表される論文数も急激に膨張し、ビッグデータ化している
がんに関する論文だけでも年間数十万報
データ駆動型の解析に頼らざるを得ない
仮説を立て、それを検証するために実証実験を行うというノスタルジックな生命科学は終焉を迎え、統計学や人工知能(AI)を活用するなどした判断が比重を増すことになると予想される
ミッション先導型研究からデータ先導型研究へのシフト